La qualité de l'information dans les réseaux sociaux en ligne : une approche non supervisée et rapide de détection de spam
نویسندگان
چکیده
Online social networks provide data valuable for a tremendous range of applications. However, the easy-to-use interfaces and low limits of the publication generate various information quality problems, such the user-generated content in such networks. The existence of ill-intentioned users, so-called social spammers, belongs to this environments. The major limitations of the methods detecting spams are the use of supervised learning approaches that requiring ground truth data-sets. Moreover, the account-based detection methods are not practical for processing "crawled" large collections of social posts, requiring months to process such collections. Hence, in this paper, we introduce a design of an unsupervised learning approach dedicated for detecting spam accounts existing in large collections of "trending" topics. Our experimental evaluation on Twitter demonstrates the efficiency of our approach as well as its speed comparing to supervised approaches. MOTS-CLÉS : Twitter, Réseau Social, Spam
منابع مشابه
SemMEP : Nouvelle approche sémantique pour la détection des communautés dans un réseau social
Résumé : Plusieurs travaux ont porté sur la détection des communautés dans les réseaux sociaux. La majorité d’entre eux considère seulement la structure d’un réseau en négligeant la richesse sémantique des informations associées à ses utilisateurs et aux liens entre eux. D’autres approches se sont focalisées sur ses aspects sémantiques. Récemment des nouvelles approches ont proposé une modélisa...
متن کاملUne approche centrée graine pour la détection de communautés dans les réseaux multiplexes
Résumé. Nous nous intéressons dans ce travail au problème de détection de communautés dans les réseaux multiplexes. Le modèle de réseau multiplexe a été récemment introduit afin de faciliter la modélisation des réseaux multirelationnels, des réseaux dynamiques et/ou des réseaux attribués. Les approches existantes pour la détection de communautés dans ce genre de graphes sont, pour la plupart, b...
متن کاملDétection de changements de distribution dans un flux de données : une approche supervisée
Résumé. L’analyse de flux de données traite des données massives grâce à des algorithmes en ligne qui évitent le stockage exhaustif des données. La détection de changements dans la distribution d’un flux est une question importante dont les applications potentielles sont nombreuses. Dans cet article, la détection de changement est transposée en un problème d’apprentissage supervisé. Nous avons ...
متن کاملAnalyse intégrée des réseaux sociaux pour la détection et la visualisation de communautés
RÉSUMÉ. Les réseaux sociaux contiennent une quantité importante d’information qui peut être divisée en deux dimensions : d’abord une dimension structurelle composée par l’information concernant les connexions entre les acteurs du réseau, puis une dimension de composition qui décrit chacun des acteurs de façon individuelle. Pour analyser un réseau, dans la plupart de cas, seulement une des dimen...
متن کاملCauses of Increased Intracranial Blood Flow Rate (Angiographic Study)
"Etude etiologique de la circulation ra.pide iutra-rena-le" Le but de l'angiographle renale n'est pas '.seulement le controle anatomique de l'organe, une etude physiologique (Hemodynamique) doit toujours etre prise en consideration. Le temps normal de la circulation intra-renale selon les differents auteurs varie entre 6 a 8, 8 a 10 et 10 a 12 secondes, mais le temps moyen est de 6 a 8 seco...
متن کامل